# -*- coding: utf-8 -*-
'''
autor: João Manuel Pires Alturas 
data criação: 2011/11/29
linguagem: python

'''
import urllib2
from BeautifulSoup import BeautifulSoup
# vou abrir uma pagina HTML 
# obtive ajuda do professor
class openPage:

    def __init__(self, endereco):
        self.endereco = endereco

    def getDados(self):
        fs = urllib2.urlopen(self.endereco)
        doc = fs.read()
        soup = BeautifulSoup( doc)
        print soup.prettify()
        lista = soup.findAll('div')
        lista1 = soup.findAll('h1')
        lista2 = soup.findAll('h2')
        lista3 = soup.findAll('h3')
        lista4 = soup.findAll('p')
        lista5 = soup.findAll('ul')
        lista6 = soup.findAll('ol')
        dic = {}
        dic['div'] = len(lista)
        dic['h1'] = len(lista1)
        dic['h2'] = len(lista2)
        dic['h3'] = len(lista3)
        dic['p'] = len(lista4)
        dic['ul'] = len(lista5)
        dic['ol'] = len(lista6)
        #return len(lista),len(lista1), len(lista2),len(lista3),len(lista4),len(lista5),len(lista6)
        return dic











